出道即巅峰！详测月之暗面 AI ，1秒搞定20 万字贵州茅台年报，GPT4都看傻了

Original 风清徐徐来 AI变现研习社 2024-06-01

你好，我是清风徐来

这是《ChatGPT ，从入门到精通》系列第 122 篇原创文章。

本公众号已开通 AI 学习 VIP 微信群！加入方式见这篇《普大喜奔！VIP 学习群已开通！入群方式+文章集锦》。

今天再给大家介绍一个国产 AI，月之暗面（Moonshot Al），

月之暗面AI 宣布在长文本领域实现了突破，并于 10 月 10 日开始公测，推出支持输入20 万汉字！！！的上下文大模型 moonshot，以及搭载该模型的智能助手产品 Kimi Chat。

刚看到这条新闻，我哑然失笑，

中国目前“百模大战”，软文满天飞，谁都敢说自己是第一。

20 万汉字的上下文，什么概念？2.5 倍于 Anthropic 公司的 Claude-100k（实测约 8 万字），8 倍于 OpenAI 公司的 GPT-4-32k（实测约 2.5 万字），唬谁呢？

但我还是半信半疑申请了测试，大概 1 周，申请通过。

测试了下，支持 20 万字居然是真的！

Moonshot Al 轻轻松松，几秒钟就吃下了我上传的茅台的 2022 年度报告！

并对内容进行了提取，分析也头头是道

这可是 126 页，12.5 万汉字的 PDF 大文件啊！小伙伴都惊呆了

我立马来了兴趣，查了查背景，4 月份刚工商注册！

创始人全是清华学子，还有卡梅隆计算机博士，谷歌、苹果工作背景，红杉领投，已经融资 20 亿元

名门之后，出道即巅峰！

这不是就是妥妥的月柱吗？

详细评测后，我认为它有第一国产 AI 的潜力！

#国产AI评测集锦:水柱文心一言，音柱通义千问，炎柱讯飞星火

一、背景介绍

名称：月之暗面（Moonshot Al）
定位：通用大模型
开发者：北京月之暗面科技有限公司，工商登记 2023 年 4 月 17 日
股权结构如下图（企查查）：

联合创始人：杨植麟、周昕宇、吴育昕

据说，Moonshot Al 月之暗面的名字来自于首席创始人杨植麟最喜欢的一张专辑——Pink Floyd的《Dark Side of the Moon》

公司成立的日期正好是这张专辑发行的 50 周年。由于始终背对地球，月球的暗面始终处在地球人的视线之外，它象征着神秘与未知，而公司的愿景就是在人工智能领域探索这种未知。

我看好这个团队，因为顶级的科学家都是哲学家，爱听 pink Floyd 的都是哲学家

DON'T help them to bury the light，DON'T give in whthout a fight!

我眼前不禁浮现这样一个场景，深夜，一位戴着耳机，边听佛洛依德，边撸代码的少年程序员

团队：目前 50 人左右团队，半数以上的成员拥有海外经历，分别来自谷歌、Meta、亚马逊等全球科技巨头，整体团队包括了 NLP、CV、RL、Infra 等方面人才，做了很多有世界级影响力的工作
产品特点：大家可以去看微信公众号“甲子光年”的文章，大概意思是算法独有特色，长文独步天下，同时没有牺牲对话质量。

杨在采访中提到的国内其他大模型，为了达到长文的几种缺陷：金鱼（健忘）、蜜蜂（忽略整体）、蝌蚪（发育不全）。比喻很有趣，我摘录如下：

“金鱼”模型，容易“健忘”。通过滑动窗口等方式主动抛弃上文，只保留对最新输入的注意力机制。模型无法对全文进行完整理解，无法处理跨文档的比较和长文本的综合理解。例如，无法从一篇10万字的用户访谈录音转写中提取最有价值的10个观点。

“蜜蜂”模型，只关注局部，忽略整体。通过对上下文的降采样或者RAG（检索增强的生成），只保留对部分输入的注意力机制。模型同样无法对全文进行完整理解。例如，无法从50个简历中对候选人的画像进行归纳和总结。

“蝌蚪”模型，模型能力尚未发育完整。通过减少参数量（例如减少到百亿参数）来提升上下文长度，这种方法会降低模型本身的能力，虽然能支持更长上下文，但是大量任务无法胜任。

据第三方报道：“月之暗面的 Kimi Chat 通过创新的网络结构和工程优化，在千亿参数下实现了无损的长程注意力机制，不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。”

我不禁想起了美剧《硅谷》主人公的无敌算法！

在本文即将成文之际，看到这样一个比较图：

二、评测

1、官方网址

www.moonshot.cn

点击“阅读原文”，到“国产 AI”，可访问

2、申请测试

点击立即体验

提交申请后，大概 5、6 天通过

3、界面介绍

界面简洁，说明也言简意赅

左上是“历史会话“

下面是提示词建议

中间是提示语输入框，有三个按钮：联网提示图标、文件上传键

这几个按键大有乾坤！

有实时联网功能！

实时联网，号称最快的 GPT3.5 做不到！

号称最长上下文的 claude2 也做不到！

这个更牛，可以上传，一次 50 个，每个 100M 的 PDF、WORD、PPT、XLS、TXT

意思是一次可以上传 5 个 G 的文件？（实测，不管上传多少个文件，不能超过 20 万字的上下文长度）

大家知道，为什么 Claude2 现在还可以对抗 GPT 么？就是因为他支持长文的能力！

在公测中，支持每个用户上传 20 万个汉字的文件，只能说独步天下！

4、逻辑测试

老规矩，搬出之前的智力题

1、如果所有的鸟都会飞，并且企鹅是鸟，那么企鹅能飞吗？
2、四两拨千金，二两拨几斤？
3、蒸熟一个馒头要10分钟，蒸10个馒头要几分钟？
4、小明父母结婚，为什么没有通知小明参加？
5、周树人为什么殴打鲁迅？
6、树上有10只鸟，猎人开枪打死了一只，请问还剩几只鸟？
7、曹操小时候的墓穴里面有曹操的尸体吗？
8、猫之于猫科动物，就像狼之于什么？
9、所有的苹果都是水果。没有香蕉是苹果。那么，所有的香蕉都是水果吗？
10、小红每天上午7点起床，8点出门上学。如果她每天需要30分钟吃早饭，那么她每天什么时候开始吃早饭？

月之暗面回答如下图：

除了第 10 题错误，其他都对。第 10 题上次测试 GPT4 都错了。

同一份逻辑题，主流 AI 评测结果如下：

5、通识

还是之前其他 AI 评测题目

问题1：请描述量子力学的基本原理。
问题2.请为我翻译以下句子到五种不同的语言："许多年之后,面对行刑队,奥雷良诺·布恩地亚上校将会回想起,他父亲带他去见识冰块的那个遥远的下午。"
问题3：请写一个简短的故事关于一只猫和一只狗的冒险。
问题4：解释冷战的原因和结果。
问题5：给出一个具有两个未知数的方程，然后解这个方程。
问题6：描述人类的感觉系统和它是如何工作的。
问题7：请编写一个简单的Python程序来实现冒泡排序算法。
问题8：请用简单的话解释相对论。
问题9：请给出一些建议如何改善心理健康。
问题10：模拟一段你与柏拉图的对话。

在月之暗面回答后，我把答案贴给 GPT4，让它评分

结果如下：

得到了国产 AI 的最高分 96 分！

6、综合技能测试

实时联网：支持！

读网页链接：支持！

不但可以搜索最新消息，还可以读取网页链接，进行总结！

GPT 可以做到，但是 GPT 读取国内网页有障碍

上传文件：支持！

这里有个小插曲，前几天学习群有个同学，说有个 1 页的 PDF，GPT 和 claude 死活读不出来

一读就报错，估计是文件格式有错

输入月之暗面，轻松搞定！看来它的兼容性比较强

识图：不支持！

上传图片会报错！

给出链接，它只能说明图片的大小，来源，无法读取图片上的内容，遗憾

输出内容

支持输出为 mk,表格格式

在线搜图：不支持
AI 绘图👧🏻；不支持
可视化📊：不支持
APP：暂无

总的来讲，周边功能不是很全，但是上传文档、联网确实比较强！不支持的功能相信会逐步完善和开放

7、大文件测试

（1）单个大文件读取：

如前所述，支持一次性数量不超过 50 个，每个不超过 100M 的文件上传

12 万汉字（不含空格）的贵州茅台 PDF 半年报，轻松读取

首先让它概述

提示2：将2022年度主要财务数据提取，汇集为表格格式

（2）多个大文件交叉比对

测了三次，试了三个方法，最后搞定

第一次：

比如，我们要分析茅台、五粮液

我们到巨潮下载两个年报，上传给月之暗面 AI

但事与愿违，月之暗面拒绝了，说对话长度超过了对话长度的 55%。

我查了下五粮液+茅台，两份报告不计空格合计27.5 万个汉字，超过 20 万字的对话长度。

第二次

我这次分两次上传，1 次传 1 个文件，然后让 AI 一次性分析，但是还是被拒绝了

经过测试，规律如下：不管你传多少文件上去，一次性只能处理 20 万字的上下文，这里的上下文包括分多次一个一个上传的文件。

第三次

不过，机智如我，有其他办法，还记得之前我们如何利用 newbing 查询数据的么？

因为月之暗面可以实时联网，不需要上传文件，它也可以搜索最新数据

提示：请比较贵州茅台和五粮液的2022年报中主要财务指标，并以表格形式列出

AI 自动联网，搜索第三方数据，然后对比

AI 还分析说

从上表可以看出，贵州茅台在营收、净利润、毛利率、

净资产收益率和总资产周转率等方面均优于五粮液。然而，五粮液在存货周转率、应收账款周转率、流动比率、速动比率和资产负债率等方面表现较好。这表明贵州茅台在盈利能力和资产利用效率方面具有优势，而五粮液在资产负债管理和运营效率方面表现较好。

（3）EXCEL 表信息分析

我把之前让 GPT4 分析的泰坦尼克生存 csv 文件传上去，让月之暗面分析

提示1：“这是什么文件？"

AI 答复：

是一个包含乘客信息的CSV文件。文件中包含了乘客的姓名、性别、年龄、登船港口、舱位、票价、所属船只和生存状态等信息。这些信息可能是关于某艘船上的乘客的记录。

提示2：”请分析是否越是头等舱，越年轻，存活率越高“

月之暗面答复：结论是，越是头等舱，越年轻，存活率越高。

为了分析这个问题，我们需要对数据进行统计和比较。首先，我们可以计算每个舱位等级的乘客的平均年龄，然后计算每个舱位等级的存活率。以下是对数据的分析：

计算每个舱位等级的平均年龄：

1st舱位：平均年龄 = 41.87岁
2nd舱位：平均年龄 = 32.44岁
3rd舱位：平均年龄 = 29.62岁
计算每个舱位等级的存活率：

1st舱位：存活率 = 66.67%
2nd舱位：存活率 = 48.15%
3rd舱位：存活率 = 38.89%
根据以上分析，我们可以得出以下结论：

舱位等级越低，乘客的平均年龄越低。
舱位等级越低，乘客的存活率越高。
所以，我们可以得出结论：越是头等舱，越年轻，存活率越高。

提示3：“增加年龄段分析“

AI 一番分析后的结论是：舱位等级越低，年龄越小，存活率越高。

提示4：“增加性别因素“

AI 分析后认为: 在 1st 舱位，男性的存活率相对较高。在 2nd 舱位和 3rd 舱位，女性的存活率相对较高。

提示5：综合上述分析，你有什么结论？

AI 答复：

 综合上述分析，我们可以得出以下结论：

1. 舱位等级越低，乘客的平均年龄越低，存活率越高。这说明头等舱的乘客相对年轻，且存活率较高。

2. 在考虑年龄分段因素的情况下，舱位等级越低，年龄越小，存活率越高。这进一步证实了头等舱乘客的年轻和高存活率特点。

3. 在考虑性别因素的情况下，1st舱位的男性存活率相对较高，而2nd舱位和3rd舱位的女性存活率相对较高。这表明在不同舱位等级中，不同性别的乘客存活率有所差异。

综上所述，我们可以得出结论：在这次数据分析中，头等舱的乘客相对年轻，且存活率较高。同时，在不同舱位等级中，不同性别的乘客存活率也存在差异。

提示词6：请以仓位、年龄段、性别进行组合，按存活率高低进行排序

从这个答案，你可以看出月之暗面和世界最强 AI 的 GPT4 的智力差异，

GPT4 直接给出了对比图：

还分析如下：

从这个图中，我们可以看到一些模式：

在所有的乘客类型中，二等舱的儿童（"2_Child"）的生存率最高，几乎接近 100%。

一等舱和二等舱的母亲（"1_Mother" 和 "2_Mother"）的生存率也很高，超过了 90%。

三等舱的父亲（"3_Father"）和二等舱的父亲（"2_Father"）的生存率最低，几乎接近 0%。

对于其他乘客（"1_Other", "2_Other", "3_Other"），一等舱的乘客的生存率最高，其次是二等舱，三等舱的生存率最低。

7、测试结论

初步测试下来，月之暗面优点如下：

支持 20 万汉字的上下文！
记忆不错。对轮对话后，还能够结合多轮前的内容进行分析。很多国产 AI 对话超过 5 轮就“健忘”了
可以实时联网，查询数据比较准确

不足：

智力水平在国产里面算一流的了，但和 GPT4 相比，还有一定差距
附加功能较弱，读图、生图、APP，数据可视化，提示助手库等，暂时没有

与其他国产 AI 总评如下：

今天只是初评，后面我们要结合多个文件，重点再次评测它的长文阅读功能，敬请期待！

最后，打个广告清风 AIChat

限免直联 GPT3+4+国内主流 AI

国内直联GPT！清风 AIchat 手把手保姆级使用教程，适合小白

刚升级到新版，已经支持全球主流模型，包括 GPT-3.5、GPT-4、清华 chatGLM 智谱、科大讯飞星火认知等

可保存对话记录，有一定免费额度，不定期有优惠活动，

国内直联地址：91chatgpt.com.cn （点击本文“阅读原文”可直达）

支持电脑和手机使用，微信可直接打开收藏使用。

新用户注册将获得 8000 积分！并且，每邀请一位新人注册，您和被邀请者将再各得 8000 积分！多邀多得！

双11优惠活动即将开始！你可先注册，以便第一时间收到活动通知！

另外，知识星球“清风 AI 学院”最近搞活动！新的付费会员，福利：

1、可获得“清风 AIchat”价值 30 元，100 万 token（约 80 万字）的使用券！
2、双11限时折扣价109元！

3、直接进入VIP会员群，无须另行付费！

欢迎转发、分享

如果你想学习 AI 知识，请后台发送“入群”或点击以下链接：

另，本公众号已开通 AI 学习 VIP 微信群！加入方式见这篇《普大喜奔！VIP 学习群已开通！入群方式+文章集锦》

5分钟搞定！AI 写工作总结+ 自动生成 PPT
DALL-E 3 从入门到精通！
免费使用GPT4的七种方法
保姆级教程！手把手教你支付宝开通 ChatGPT plus！
可视化！用 GPT4 十分钟内完成泰坦尼克号生存分析
FastGPT + Chatgpt-on-wechat + 亚马逊免费VPS+AI助理：企业知识库接入微信群! 保姆级教程
国内直联 GPT！清风 AIchat 手把手教程
2023年10月，最新免费ChatGPT 资源大全

继续滑动看下一个

AI变现研习社

向上滑动看下一个

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

出道即巅峰！详测月之暗面 AI ，1秒搞定20 万字贵州茅台年报，GPT4都看傻了

一、背景介绍

二、评测

1、官方网址

2、申请测试

3、界面介绍

4、逻辑测试

5、通识

6、综合技能测试

（1）单个大文件读取：

7、测试结论

您可能也对以下帖子感兴趣

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

生成图片，分享到微信朋友圈

出道即巅峰！详测月之暗面 AI ，1秒搞定20 万字贵州茅台年报，GPT4都看傻了

一、背景介绍

二、评测

1、官方网址

2、申请测试

3、界面介绍

4、逻辑测试

5、通识

6、综合技能测试

（1）单个大文件读取：

7、测试结论

您可能也对以下帖子感兴趣